SparseFillEmptyRows
对稀疏张量按行进行补全操作。当某一行在输入稀疏表示中不存在非零元素时, 使用给定的 default_value 为该行补充一个元素,并生成新的稀疏表示结果。 同时可选地输出反向索引映射关系。
该算子常用于保证稀疏张量在行维度上的完备性。
\[\text{if row } r \text{ is empty:} \quad
(r, 0, \dots) \rightarrow default\_value\]
- 输入:
indices_ptr - 输入稀疏索引数组地址,大小为
N × rank。values_ptr - 输入稀疏值数组地址。
- params - 参数打包成数组。
N - 输入稀疏元素个数。
rank - 稀疏张量的秩(索引维度)。
dense_rows - 稠密行数。
default_value - 用于填充空行的默认值,传指针
scratch_ptr - 中间缓冲区,用于存放前缀和信息。
filled_count - 计数数组。
core_mask - 核掩码(仅共享存储版本需要)。
- 输出:
output_y_indices_ptr - 输出稀疏索引数组地址。
output_y_values_ptr - 输出稀疏值数组地址。
output_reverse_index_map_ptr - 反向索引映射输出地址。
- 支持平台:
FT78NEMT7004
备注
FT78NE 支持fp, dp, int8, int16, int32, cplx64, cplx128
MT7004 支持hp, fp, int16, int32, cplx64
共享存储版本:
-
void i8_sparse_fill_empty_rows_s(int *indices_ptr, int8_t *values_ptr, int *output_y_indices_ptr, int8_t *output_y_values_ptr, int *output_reverse_index_map_ptr, long long *params, int core_mask)
-
void i16_sparse_fill_empty_rows_s(int *indices_ptr, int16_t *values_ptr, int *output_y_indices_ptr, int16_t *output_y_values_ptr, int *output_reverse_index_map_ptr, long long *params, int core_mask)
-
void i32_sparse_fill_empty_rows_s(int *indices_ptr, int32_t *values_ptr, int *output_y_indices_ptr, int32_t *output_y_values_ptr, int *output_reverse_index_map_ptr, long long *params, int core_mask)
-
void hp_sparse_fill_empty_rows_s(int *indices_ptr, half *values_ptr, int *output_y_indices_ptr, half *output_y_values_ptr, int *output_reverse_index_map_ptr, long long *params, int core_mask)
-
void fp_sparse_fill_empty_rows_s(int *indices_ptr, float *values_ptr, int *output_y_indices_ptr, float *output_y_values_ptr, int *output_reverse_index_map_ptr, long long *params, int core_mask)
-
void dp_sparse_fill_empty_rows_s(int *indices_ptr, double *values_ptr, int *output_y_indices_ptr, double *output_y_values_ptr, int *output_reverse_index_map_ptr, long long *params, int core_mask)
-
void c64_sparse_fill_empty_rows_s(int *indices_ptr, float *values_ptr, int *output_y_indices_ptr, float *output_y_values_ptr, int *output_reverse_index_map_ptr, long long *params, int core_mask)
-
void c128_sparse_fill_empty_rows_s(int *indices_ptr, double *values_ptr, int *output_y_indices_ptr, double *output_y_values_ptr, int *output_reverse_index_map_ptr, long long *params, int core_mask)
C调用示例:
1//FT78NE示例
2#include <stdio.h>
3#include <sparsefillemptyrows.h>
4
5int main(int argc, char* argv[]) {
6 int *indices_vec = (int *) 0x81000000; //索引数组
7 int *sparse_values = (int *)0x82000000; //值数组
8 int *scratch = (int *)0x83000000; //scratch数组
9 int *output_indices = (int *)0x84000000; //输出索引数组
10 int *output_values = (int *)0x85000000; //输出值数组
11 int *output_reverse_index_map = (int *)0x86000000; //输出反向索引映射数组
12 int *filled_count = (int *)0x87000000; //填充计数数组
13
14 int dims[] = {128, 8, 4};
15 int rank = 3;
16 int dense_rows = 128; //dims的第一个维度,即稠密行的数量
17 int N = 120;
18 int default_value = 0;
19
20 srand(seed++);
21
22 int i;
23 for (i = 0; i < N; i++) {
24 indices_vec[i * rank] = rand() % dims[0];
25 indices_vec[i * rank + 1] = rand() % dims[1];
26 indices_vec[i * rank + 2] = rand() % dims[2];
27 sparse_values[i] = rand() % 100;
28 }
29
30 compute_scratch(N, rank, dense_rows, indices_vec, scratch);
31
32 //
33 long long params[11];
34 params[0] = (long long)N;
35 params[1] = (long long)rank;
36 params[2] = (long long)dense_rows;
37 params[3] = (long long)&default_value;
38 params[4] = (long long)scratch;
39 params[5] = (long long)filled_count;
40
41 int core_mask = 0b1111;
42 i32_sparse_fill_empty_rows_s(indices_vec, sparse_values, output_indices, output_values, output_reverse_index_map, params, core_mask);
43
44 return 0;
45}
私有存储版本:
-
void i8_sparse_fill_empty_rows_p(int *indices_ptr, int8_t *values_ptr, int *output_y_indices_ptr, int8_t *output_y_values_ptr, int *output_reverse_index_map_ptr, long long *params)
-
void i16_sparse_fill_empty_rows_p(int *indices_ptr, int16_t *values_ptr, int *output_y_indices_ptr, int16_t *output_y_values_ptr, int *output_reverse_index_map_ptr, long long *params)
-
void i32_sparse_fill_empty_rows_p(int *indices_ptr, int32_t *values_ptr, int *output_y_indices_ptr, int32_t *output_y_values_ptr, int *output_reverse_index_map_ptr, long long *params)
-
void hp_sparse_fill_empty_rows_p(int *indices_ptr, half *values_ptr, int *output_y_indices_ptr, half *output_y_values_ptr, int *output_reverse_index_map_ptr, long long *params)
-
void fp_sparse_fill_empty_rows_p(int *indices_ptr, float *values_ptr, int *output_y_indices_ptr, float *output_y_values_ptr, int *output_reverse_index_map_ptr, long long *params)
-
void dp_sparse_fill_empty_rows_p(int *indices_ptr, double *values_ptr, int *output_y_indices_ptr, double *output_y_values_ptr, int *output_reverse_index_map_ptr, long long *params)
-
void c64_sparse_fill_empty_rows_p(int *indices_ptr, float *values_ptr, int *output_y_indices_ptr, float *output_y_values_ptr, int *output_reverse_index_map_ptr, long long *params)
-
void c128_sparse_fill_empty_rows_p(int *indices_ptr, double *values_ptr, int *output_y_indices_ptr, double *output_y_values_ptr, int *output_reverse_index_map_ptr, long long *params)
C调用示例:
1//FT78NE示例
2#include <stdio.h>
3#include <sparsefillemptyrows.h>
4
5int main(int argc, char* argv[]) {
6 int *indices_vec = (int *) 0x10010000; //索引数组
7 int *sparse_values = (int *)0x10018000; //值数组
8 int *scratch = (int *)0x10020000; //scratch数组
9 int *output_indices = (int *)0x10028000; //输出索引数组
10 int *output_values = (int *)0x10030000; //输出值数组
11 int *output_reverse_index_map = (int *)0x10038000; //输出反向索引映射数组
12 int *filled_count = (int *)0x100580000; //填充计数数组
13
14 int dims[] = {128, 8, 4};
15 int rank = 3;
16 int dense_rows = 128; //dims的第一个维度,即稠密行的数量
17 int N = 120;
18 int default_value = 0;
19
20 srand(seed++);
21
22 int i;
23 for (i = 0; i < N; i++) {
24 indices_vec[i * rank] = rand() % dims[0];
25 indices_vec[i * rank + 1] = rand() % dims[1];
26 indices_vec[i * rank + 2] = rand() % dims[2];
27 sparse_values[i] = rand() % 100;
28 }
29
30 compute_scratch(N, rank, dense_rows, indices_vec, scratch);
31
32 //
33 long long params[11];
34 params[0] = (long long)N;
35 params[1] = (long long)rank;
36 params[2] = (long long)dense_rows;
37 params[3] = (long long)&default_value;
38 params[4] = (long long)scratch;
39 params[5] = (long long)filled_count;
40
41 i32_sparse_fill_empty_rows_p(indices_vec, sparse_values, output_indices, output_values, output_reverse_index_map, params);
42
43 return 0;
44}